Reporte de IA de la Semana 9 (28/03/25) - (03/04/25)
FISIO FIND - REPORTE DE IA DE LA SEMANA 9 (28/03/25) - (03/04/25)
Ficha del documento
-
Nombre del Proyecto: FISIO FIND
-
Número de Grupo: Grupo 6
-
Entregable: #SPRINT 3
-
Miembros del grupo:
Alberto Carmona Sicre, Antonio Macías Ferrera, Benjamín Ignacio Maureira Flores, Francisco Capote García,
Daniel Alors Romero, Daniel Fernández Caballero, Daniel Ruiz López, Daniel Tortorici Bartús,
Daniel Vela Camacho, Delfín Santana Rubio, Guadalupe Ridruejo Pineda, Julen Redondo Pacheco,
Miguel Encina Martínez, Francisco Mateos Villarejo, Pablo Fernández Pérez, Ramón Gavira Sánchez,
Rafael Pulido Cifuentes. -
Contribuidores: Daniel Fernández Caballero Daniel Ruiz López (autores)
-
Fecha de Creación: 03/04/2025
-
Versión: v1.0
Histórico de Modificaciones
Fecha | Versión | Realizada por | Descripción de los cambios |
---|---|---|---|
03/04/2025 | v1.0 | Daniel Fernández Caballero, Daniel Ruiz López | Elaboración de la primera versión del documento. |
PROMPTS UTILIZADOS
A continuación se presentan los distintos prompts evaluados junto con sus respectivas puntuaciones, cantidad de prompts y porcentaje de alucinaciones.
-
- Puntuación: 5
- Prompts: 9
- Alucinaciones: 0%
-
- Puntuación: 5
- Prompts: 5
- Alucinaciones: 0%
-
- Puntuación: 5
- Prompts: 2
- Alucinaciones: 0%
-
- Puntuación: 5
- Prompts: 1
- Alucinaciones: 0%
-
- Puntuación: 5
- Prompts: 1
- Alucinaciones: 0%
-
- Puntuación: 5
- Prompts: 2
- Alucinaciones: 0%
-
- Puntuación: 5
- Prompts: 71
- Alucinaciones: 1.4%
-
- Puntuación: 5
- Prompts: 9
- Alucinaciones: 11%
-
- Puntuación: 4.5
- Prompts: 3
- Alucinaciones: 33%
-
- Puntuación: 5
- Prompts: 20
- Alucinaciones: 25%
-
- Puntuación: 5
- Prompts: 13
- Alucinaciones: 0%
ANÁLISIS ESTADÍSTICO
En esta sección, realizaremos un análisis estadístico completo basado en las puntuaciones, el número de prompts y el porcentaje de alucinaciones de los 11 casos documentados en este reporte. Calcularemos medidas como el promedio, la desviación estándar, la distribución y las correlaciones entre las variables, para luego extraer conclusiones sobre el desempeño de la IA.
Datos iniciales
Los datos a analizar son los siguientes:
- Puntuaciones: 5, 5, 5, 5, 5, 5, 5, 5, 4.5, 5, 5
- Número de prompts: 9, 5, 2, 1, 1, 2, 71, 9, 3, 20, 13
- Alucinaciones (%): 0, 0, 0, 0, 0, 0, 1.4, 11, 33, 25, 0
Estos valores corresponden a los 11 prompts evaluados, cada uno con su respectiva puntuación (escala de 1 a 5), cantidad de prompts utilizados y porcentaje de alucinaciones.
Análisis de las puntuaciones
1. Promedio (Media)
Para calcular el promedio de las puntuaciones, sumamos todos los valores y los dividimos entre el número total de casos, que es 11.
Suma de las puntuaciones:
5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 4.5 + 5 + 5 = 54.5
Promedio:
54.5 ÷ 11 ≈ 4.95
El promedio de las puntuaciones es 4.95. Esto indica un desempeño excepcionalmente alto de la IA, muy cercano al máximo de la escala (5), reflejando una calidad percibida casi perfecta en las interacciones.
2. Desviación estándar
La desviación estándar mide cuánto se alejan las puntuaciones del promedio. Primero calculamos la varianza.
Paso 1: Calcular la varianza
Restamos el promedio (4.95) a cada puntuación, elevamos al cuadrado, sumamos y dividimos entre 11:
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
(4.5 - 4.95)² = 0.2025
(5 - 4.95)² = 0.0025
(5 - 4.95)² = 0.0025
Suma de las diferencias al cuadrado:
0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.0025 + 0.2025 + 0.0025 + 0.0025 = 0.2275
Varianza:
0.2275 ÷ 11 ≈ 0.0207
Paso 2: Calcular la desviación estándar
Desviación estándar:
√0.0207 ≈ 0.14
La desviación estándar es aproximadamente 0.14, indicando una dispersión extremadamente baja. Las puntuaciones están muy concentradas alrededor del promedio de 4.95, mostrando gran consistencia.
3. Distribución de las puntuaciones
Contamos cuántas veces aparece cada valor:
- 4.5: 1 vez (9.09%)
- 5: 10 veces (90.91%)
Observación: La puntuación dominante es 5 (90.91%), con un único caso de 4.5. Esto refleja un desempeño casi uniforme y de alta calidad, con mínima variación.
Análisis del número de prompts
1. Promedio (Media)
Sumamos todos los valores del número de prompts y dividimos entre 11.
Suma de los prompts:
9 + 5 + 2 + 1 + 1 + 2 + 71 + 9 + 3 + 20 + 13 = 136
Promedio:
136 ÷ 11 ≈ 12.36
El promedio del número de prompts es 12.36, sugiriendo que las interacciones tienden a ser relativamente largas en promedio, aunque hay una amplia variación.
2. Desviación estándar
Paso 1: Calcular la varianza
Restamos el promedio (12.36) a cada valor, elevamos al cuadrado, sumamos y dividimos entre 11:
(9 - 12.36)² = 11.2896
(5 - 12.36)² = 54.1696
(2 - 12.36)² = 107.6496
(1 - 12.36)² = 129.0496
(1 - 12.36)² = 129.0496
(2 - 12.36)² = 107.6496
(71 - 12.36)² = 3437.0896
(9 - 12.36)² = 11.2896
(3 - 12.36)² = 87.6096
(20 - 12.36)² = 58.3696
(13 - 12.36)² = 0.4096
Suma:
11.2896 + 54.1696 + 107.6496 + 129.0496 + 129.0496 + 107.6496 + 3437.0896 + 11.2896 + 87.6096 + 58.3696 + 0.4096 = 4133.6344
Varianza:
4133.6344 ÷ 11 ≈ 375.785
Paso 2: Calcular la desviación estándar
Desviación estándar:
√375.785 ≈ 19.38
La desviación estándar es 19.38, mostrando una dispersión muy alta debido al valor extremo de 71 prompts.
3. Rango
- Mínimo: 1 prompt
- Máximo: 71 prompts
- Rango = 71 - 1 = 70
Observación: El rango amplio y la alta desviación estándar reflejan una gran variabilidad en la longitud de las interacciones.
Análisis de las alucinaciones
1. Promedio (Media)
Sumamos los porcentajes de alucinaciones y dividimos entre 11:
0 + 0 + 0 + 0 + 0 + 0 + 1.4 + 11 + 33 + 25 + 0 = 70.4
Promedio:
70.4 ÷ 11 ≈ 6.4
El promedio de alucinaciones es 6.4%, indicando que, en general, las respuestas de la IA son bastante precisas, con un bajo nivel de error promedio.
2. Desviación estándar
Paso 1: Calcular la varianza
Restamos el promedio (6.4) a cada valor, elevamos al cuadrado, sumamos y dividimos entre 11:
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(0 - 6.4)² = 40.96
(1.4 - 6.4)² = 25
(11 - 6.4)² = 21.16
(33 - 6.4)² = 707.56
(25 - 6.4)² = 345.96
(0 - 6.4)² = 40.96
Suma:
40.96 + 40.96 + 40.96 + 40.96 + 40.96 + 40.96 + 25 + 21.16 + 707.56 + 345.96 + 40.96 = 1346.44
Varianza:
1346.44 ÷ 11 ≈ 122.4
Paso 2: Calcular la desviación estándar
Desviación estándar:
√122.4 ≈ 11.06
La desviación estándar es 11.06, indicando una dispersión moderada, influida por valores altos como 33% y 25%.
3. Distribución de las alucinaciones
- 0%: 7 veces (63.64%)
- 1.4%: 1 vez (9.09%)
- 11%: 1 vez (9.09%)
- 25%: 1 vez (9.09%)
- 33%: 1 vez (9.09%)
Observación: La mayoría (63.64%) no tiene alucinaciones, pero hay casos aislados con porcentajes significativos (hasta 33%).
Relación entre variables
1. Puntuaciones y número de prompts
- ∑x = 54.5, ∑y = 136, ∑xy = 5×9 + 5×5 + ... + 5×13 = 672, ∑x² = 247.25, ∑y² = 4136
- r = [11 × 672 - 54.5 × 136] ÷ √([11 × 247.25 - 54.5²] × [11 × 4136 - 136²])
- r = [7392 - 7412] ÷ √([2720.75 - 2970.25] × [45496 - 18496]) ≈ -20 ÷ √(-249.5 × 27000) ≈ 0.008
Resultado: Correlación 0.008 (prácticamente nula). No hay relación significativa entre puntuaciones y prompts.
2. Puntuaciones y alucinaciones
- ∑x = 54.5, ∑y = 70.4, ∑xy = 5×0 + 5×0 + ... + 5×0 = 242.5, ∑x² = 247.25, ∑y² = 1496.36
- r = [11 × 242.5 - 54.5 × 70.4] ÷ √([11 × 247.25 - 54.5²] × [11 × 1496.36 - 70.4²]) ≈ -1168.9 ÷ √(-249.5 × 11499.84) ≈ -0.69
Resultado: Correlación -0.69 (negativa moderada-fuerte). Más alucinaciones tienden a reducir las puntuaciones.
3. Número de prompts y alucinaciones
- ∑x = 136, ∑y = 70.4, ∑xy = 9×0 + 5×0 + ... + 13×0 = 614, ∑x² = 4136, ∑y² = 1496.36
- r = [11 × 614 - 136 × 70.4] ÷ √([11 × 4136 - 136²] × [11 × 1496.36 - 70.4²]) ≈ -2810.4 ÷ √(27000 × 11499.84) ≈ -0.16
Resultado: Correlación -0.16 (negativa débil). Poca relación entre prompts y alucinaciones.
Tendencias y observaciones
- Puntuaciones: Promedio de 4.95 y desviación de 0.14 reflejan un desempeño casi perfecto y muy consistente.
- Número de prompts: Promedio de 12.36 y desviación de 19.38 muestran gran variabilidad, con un outlier (71).
- Alucinaciones: Promedio de 6.4% y desviación de 11.06 indican alta precisión general, pero con casos puntuales de error.
- Relaciones: Las alucinaciones afectan negativamente las puntuaciones (-0.69), mientras que el número de prompts tiene un impacto mínimo (0.008 y -0.16).
Conclusión del análisis estadístico
- Puntuaciones: Promedio de 4.95 y desviación de 0.14 confirman un desempeño sobresaliente y uniforme.
- Número de prompts: Promedio de 12.36 y alta desviación (19.38) reflejan interacciones de longitud muy variable.
- Alucinaciones: Promedio de 6.4% y desviación de 11.06 muestran precisión general, con excepciones notables.
- Relación: Las alucinaciones son el principal factor que reduce las puntuaciones (-0.69), mientras que la cantidad de prompts no influye significativamente.
Aprobado por
Scrum Master: Antonio Macías Ferrera